NR 数据库注释结果说明 您所在的位置:网站首页 ncbi16s序列比对 多少可以鉴定到菌种 NR 数据库注释结果说明

NR 数据库注释结果说明

2024-07-07 19:11| 来源: 网络整理| 查看: 265

NR 数据库注释结果说明 结果简介 目录结构 格式说明*.anno.txt -NR 数据库注释的结果文件*.nr.m8.txt – NR 数据库进行 BLAST 比对结果*.nr.species.anno -NR 数据库物种注释的结果*.nr.species.anno.pdf -NR 数据库物种注释统计图,pdf格式*.nr.species.anno.png -NR 数据库物种注释统计图常用格式m8 文件

NR 数据库注释结果说明 结果简介

NR 全称为 Non-Redundant Protein Database,是一个非冗余的蛋白质数据库,由 NCBI 创建并维护,其特点在于内容比较全面,同时注释结果中会包含有物种信息,可作物种分类用。 使用 Diamond 软件,把目标物种的氨基酸序列,与 NR 数据库进行比对,把目标物种的基因和其相对应的功能注释信息结合起来,得到注释结果。由于每一条序列比对结果可能超过一条,为保证其生物意义,注释时保留一条最优比对结果作为该基因的注释。最后提供的 Diamond 比对结果为 M8 格式,同时还提供部分数据库的注释结果汇总。根据基因注释到的物种情况,按照物种统计注释到的基因数目,提供前 20 个物种及基因 ID。 如无特殊说明,以下内容中的“*”代表目标物种的样品名

目录结构

NR ├── *.nr.m8.txt 【NR 数据库进行 BLAST 比对结果】 ├── *.nr.species.anno 【NR 数据库物种注释的结果】 ├── *.nr.species.anno.pdf 【NR 数据库物种注释统计图,pdf格式】 └── *.nr.species.anno.png 【NR 数据库物种注释统计图】

格式说明*.anno.txt -NR 数据库注释的结果文件

制表符分割的文本文档,使用 excel 打开。 文件内容对应于文件*.nr.m8.txt。

文件内容举例如下:

文件内容说明如下:

列数列标题说明1qseqid目标物种的氨基酸序列的 ID,编号的有效字符有[a-zA-Z0-9.:^x!+_?-]2sseqid数据库序列ID3pident目标物种的氨基酸序列与数据库序列比对的 Identity 值4evalue目标物种的氨基酸序列与数据库序列比对的 E-value 值5bitscore目标物种的氨基酸序列与数据库序列比对的比对得分6Subject_description详细描述*.nr.m8.txt – NR 数据库进行 BLAST 比对结果

m8 格式,使用 excel 打开。

m8 格式详细说明见【4 常用格式】中【4.1 m8 文件】部分。

*.nr.species.anno -NR 数据库物种注释的结果

制表符分割的文本文档,使用 excel 打开。

文件内容对应于文件*.nr.m8.txt。文件内容举例如下

文件内容说明如下:

列数列标题说明1species_name物种名称,可能不止是种,有可能定位到菌种/亚种/属等2gene_num基因数量3gene_id基因编号

 

*.nr.species.anno.pdf -NR 数据库物种注释统计图,pdf格式

图片展示内容与*.png 一样。pdf格式。

*.nr.species.anno.png -NR 数据库物种注释统计图

PNG 格式,用图片浏览器打开。

图片示例如下:

图例说明: 横坐标表示物种ID,纵坐标表示注释上的基因个数。注意可能注释到亚种/菌群上。

常用格式m8 文件

格式为列表格式的 BLAST/ Diamond 比对结果。

m8 格式举例如下:

文件内容说明如下:

列数说明1目标物种的氨基酸序列的 ID,编号的有效字符有[a-zA-Z0-9.:^x!+_?-]2数据库序列的 ID3目标物种的氨基酸序列与数据库序列比对的 Identity 值4目标物种的氨基酸序列与数据库序列比对的长度5目标物种的氨基酸序列与数据库序列比对区域的比对错配数6目标物种的氨基酸序列与数据库序列比对区域的比对空位数。7目标物种的氨基酸序列的比对起始坐标8目标物种的氨基酸序列的比对终止坐标9数据库序列的比对起始坐标10数据库序列的比对终止坐标11目标物种的氨基酸序列与数据库序列比对的期望值12目标物种的氨基酸序列与数据库序列比对的比对得分

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有